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Багаторівнева багатозначна модель 
перетворення орфографічного 
тексту на фонемний 


У статті розглядається актуальне питання породження послідовностей фонем за орфографічним 
текстом 1 зворотне перетворення. Пропонується модель, у якій закладені закономірності зв'язку між 
фонетичними й орфографічними символами. Багатозначні перетворення, що здійснюються згідно з 
моделлю, еквівалентні побудові направленого графа. Параметри моделі задаються таблично у вигляді 
контекстно-залежних правил, які формує експерт. У моделі передбачено введення додаткових рівнів 
транскрибування, що дає змогу експертові будувати складніші перетворення, працюючи з відносно 
простими правилами. Розроблено систему, на вхід якої подається орфографічний текст із позначен- 
нями наголосу, а на виході отримуємо послідовності фонем, які відповідають різним варіантам вимови 
вхідного тексту. Наводяться приклади практичного застосування системи для автоматичного розпізнавання 
українського спонтанного мовлення. 


Вступ 


Породження послідовностей фонем за орфографічним текстом 1 навпаки (пород- 
ження послідовностей слів за фонемним текстом) є актуальним питанням у царині усно- 
мовної інформатики. Графемно-фонемні перетворення потрібні для транскрибування 
текстів у системах озвучення інформації, для формування словників вимови під час 
оцінки параметрів акустичної моделі в різних схемах декодування усномовного сигналу 
тощо (1-41. 

Перетворення орфографічного тексту (графем) на фонемний текст (транскрип- 
цію, зроблену за допомогою фонем) неможливе без вивчення закономірностей зв'язку 
між фонетичними та орфографічними символами. 

Тривалий час графемно-фонемне перетворення реалізовувалось у вигляді певного 
алгоритму -- транскриптора, що відтворює у програмному коді правила читання, узяті з 
підручника або довідника (51. 

Потрібно зазначити, що, на відміну від орфографічного, фонемний текст для кож- 
ного конкретного слова не є усталеним як із суб'єктивних, так і з об'єктивних причин. 

По-перше, до цього часу серед дослідників у царині фонетики та фонології три- 
вають дискусії щодо алфавіту фонем української мови (незважаючи на прийнятий 
стандарт Міжнародної фонетичної асоціації - ІРА). По-друге, алфавіт фонем для сис- 
теми розпізнавання або синтезу мовлення залежить не лише від кількості фонем мови, а 
й від того, яке фонетичне явище (асиміляція, редукція, палаталізація та ін.) врахо- 
вується на рівні символів, а яке - на рівні акустичної моделі шляхом уведення контекст- 
ної залежності (СД-фонеми, фонеми-трифони), використання суміші гаусоїдів (СММ) 
чи зміни топології акустичної моделі НММ. По-третє, під час розробки мовленнєвих 
технологій повинні враховуватися індивідуальні, ситуативні особливості вимови, ви- 
мова слів у потоці мовлення, а це спричиняє введення багатозначності при переході 
до фонемного тексту. 
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Відсутність розмежування між оперативним кодом (командами) і даними є серйоз- 
ною перешкодою для модифікації та вдосконалення транскриптора, тобто перетворення 
його на гнучкий інструмент дослідника. 

Задача зворотного переходу від фонемного до орфографічного тексту є відносно 
новою, вона набула актуальності з розвитком багатозначної багаторівневої моделі 
розуміння мовленнєвого сигналу |4). Реалізованому на той час алгоритму подавалося 
на вхід менше 30 правил для перетворення «фонема-графема», у результаті чого отри- 
мувалися гіпотетичні варіанти орфографічного тексту для багатозначної відповіді роз- 
пізнавання вільного порядку слідування фонем. Така незначна кількість правил поясню- 
ється властивостями української орфографії, адже правила написання для української 
мови значною мірою засновуються на фонетичному принципі (пишемо те, що чуємо). 

Подальші дослідження алгоритму полягали в його використанні у зворотному 
процесі - перетворенні орфографічного тексту на фонемний. Мета таких досліджень -- 
отримати транскриптор, який можна порівняно легко модифікувати на рівні структур 
даних без нової компіляції програмного коду. 

Зауважимо, що у світі для перетворення графем на фонеми використовуються 
статистичні методи, які аналізують створений експертами словник вимови |б6|. Це 
виправдано для мов, у яких орфографічне написання слів суттєво відрізняється від їх 
вимови (наприклад, для англійської чи французької мови). 

У розділі 2 пропонується спосіб опису закономірностей, що пов'язують орфогра- 
фічні 1 фонемні символи, та аналізується побудова графа, на якому породжуються гіпо- 
тетичні перетворення послідовностей символів. Розділ 3 присвячено комп'ютерній 
моделі алгоритму та практичному застосуванню системи транскрибування. У висновках 
обговорюються результати та подальші дослідження. 


Модель багатозначного перетворення послідовностей 
символів 


Нехай маємо скінченну послідовність символів 
(СЛР АН ЛУ ЧА (1) 
де А - алфавіт вхідних символів. Сконструюємо відображення цієї послідовності на 
множину послідовностей вихідних символів із деякого іншого алфавіту В. 
Розглянемо функцію /, що відображає послідовність а! , починаючи з її п-го 
символу, у символ алфавіту В або порожню множину: 
Діаз Ь, БеВоФ, Іспам. (2) 
Зауважимо, що (2) має місце лише у випадку, коли вхідна послідовність нале- 
жить області визначення /; тобто а) є реб( 7). Множина послідовних застосувань таких 


функцій переводить а? у послідовності символів з алфавіту В, утворюючи таким 
чином зе 


На? )- (а?) Ка)... Га) є ВЗ 02, «ке кІ, 0) 
де Ід - довжина Х-ї вихідної послідовності, загальна кількість яких, Кь, СВОЯ 
для кожної Е є Е. 
Визначимо аналог прямого добутку над множинами, отриманими внаслідок дії 
мультифункцій з К, як перебір усіх варіантів об'єднання скінченних послідовностей 
символів з алфавіту В. Тобто, опускаючи аргументи мультифункцій: 


веб а ово), Ім Є Ку, 1у є Ко | (4) 
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Припускаємо за визначенням, що якщо результат дії ЕК або С є порожньою множи- 
ною, то результатом їх добутку буде порожня множина. На відміну від декартового 
добутку для визначеного нами аналога виконується властивість асоціативності. 

Розглянемо впорядковану множину КЕ мультифункцій Е є Е, які супроводимо 
додатковими параметрами: 


РЕ. з) іс 


, 4,20, б, - 10,1), (5) 


де і є індексом мультифункції у впорядкованій множині ЕК; параметр а; наз- 
вемо шириною кроку аналізу, д, - «умовою виключності». Через ці параметри конят- 


І 
руюємо обмеження при обчисленні добутку 
М гер 
Зла, ) сі |В 
іп 
Припустимо, що ми вже обчислили вираз (6) на деяких упорядкованих 
індексних множинах ./1 М і отримали деяку непорожню множину 
г М 
См с 29 1 ЗМРАРУ (а, ) 5 (7) 
иє./ уУЄМ 


Нехай у та т є останніми елементами індексних множин ./ 1 М відповідно. Тоді 


,1спєМ, (6) 


. - М з 
при розгляді наступної компоненти добутку, Б, ; (а , проводимо обчислення згідно 


з визначенням (4), якщо виконуються такі умови: 
тя 4, зп; 
б.1, Іхк«ії; (8) 
ОО о а")Фк,, з (ад)ж Ф5,1«г«і, якщо д, - 1. 


иє / УЄМ 


В іншому випадку, при надходженні наступної компоненти добутку отримуємо 
порожню множину. 

Виразом (6) породжуються послідовності вихідних символів за деякою послідов- 
ністю вхідних символів. Якщо вхідний алфавіт збігається з алфавітом літер певної 
мови, а вихідний алфавіт складається з фонем, то маємо багатозначний транскриптор 
орфографічного тексту. І навпаки, якщо на вході - фонемний алфавіт, а на виході - 
алфавіт літер, то отримаємо багатозначне перетворення з фонемного тексту на орфо- 
графічний. Можливі проміжні варіанти. 

Приклад породження варіантів фонемного тексту за орфографічним наведено 
на рис. 1. Розглядається орфографічний текст одного слова «сніг». Із метою узагаль- 
нення стандартний алфавіт української мови (включно з апострофом) доповнено 
символом " 7, який розділяє слова. Літери, що відповідають наголошеним голосним, 
переводяться у верхній регістр, всі інші літери - у нижній. Позиція наголосу визна- 
чається за орфоепічним словником з урахуванням омографії |7| або беруться до уваги 
всі допустимі позиції наголосу. 


. . . . . М 
Отже маємо на вході послідовність із шести символів а; -(" 7, "с, "н',"Г,"г., 


7 7), У - 6. На графі відображено всі допустимі мультифункції БЕ; 5 (ад ) ІспсМ. 


Здійснюючи перехід за стрілками, отримуємо добутки вигляду (6), які генерують 
чотири послідовності фонем або фонемні тексти: 


ее 29. се рак раз 22 


сонної 33 бно "3 НАХ б б оноїе: 
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її 2 3 4 5 6(1) 6(2) і 


Рисунок І - Граф багатозначного перетворення 
орфографічного слова «сніг» на фонемну транскрипцію 


Зауважимо, що на практиці використовується не вся підпослідовність вигляду 
по-і1ЯТ 
п 


а), а лише а , де додатній параметр Т залежить від конкретної мультифункції 


і визначає ширину контексту, у якому розглядаються вхідні символи. На рис. І висота 
прямокутників у вузлах графа відповідає ширині контексту. 

Результат перетворення може бути багаторазово підданий описаним перетво- 
ренням з тими самими або іншими параметрами. Таким чином ми можемо вводити 
додаткові рівні транскрибування, на яких відбувається спрощення специфікації пара- 
метрів, що важливо для мов, у яких написання відчутно відрізняється від вимови. 


Система багаторівневого багатозначного 
транскрибування орфографічних текстів 


Пропонується система, на вхід якої подається орфографічний текст, що містить 
лише символи з алфавіту літер включно з символами границі між словами та мор- 
фемами та позначеннями наголосу. Такий текст отримуємо внаслідок автоматичного 
оброблення довільного тексту або списку слів, що полягає у вербалізації (розшиф- 
руванні) символів, чисел 1 скорочень, розставлянні наголосів і поділу на синтагми, слова 
та морфеми. На виході системи отримуємо послідовності фонем, що відповідають 
різним варіантам вимови вхідного тексту. Ця система транскрибування використовується 
для розпізнавання українського мовлення (31, |9). 

Розроблена система багатозначного транскрибування орфографічних текстів 
використовує модель (1) - (8), що дає змогу таблично задавати контекстно-залежні 
правила перетворень одних узагальнених послідовностей символів на інші. При 
цьому в кожному правилі задається ширина кроку, за яким відбувається перехід до 
наступної послідовності символів. Також є можливим застосування багатьох правил, 
що дає змогу генерувати одразу декілька варіантів транскрипції одного й того 
самого слова (або генерувати потрібний варіант із кількох можливих, наприклад, 
описуючи спонтанне мовлення мовця чи групи мовців). 

Наведемо деякі правила з поясненнями у табл. 1. 
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Таблиця 1 - Приклади побудови правил транскриптора 


; у . й Вихідна 
Вхідна підпослідовність . і Ширина 
й послідовність Пояснення 
символів й кроку 
символів 
з, с, цперед ж, ш, ч 
Їзсц| |жшч| Їїжшч| 1 переходять відповідно 


уж, ш, ч 


т перед м'якими д, Т, 
тідтзснці ПєюяЯЄЮЯь| т 1 з,с,н,Цц 
пом'якшується 


тміжсталабон 


с т |лн| с и 
випадає 


Загалом для транскрибування (для літературного варіанта вимови) достатньо 
ввести близько 30 подібних правил. 

Тестування системи транскрибування відбувалося на основі розпізнавання спон- 
танного мовлення кількох сотень дикторів (8, |9|. 

Для всіх дикторів був створений загальний варіант транскрибування на основі 
літературної вимови. Окрім цього, всі диктори були розподілені на групи, для яких 
розроблено свої правила індивідуалізованого транскрибування, що доповнюють або 
заміняють основний варіант (3). Також для однієї із груп дикторів був розроблений 
загальний варіант транскрибування спонтанного злитого мовлення |З). 

Результати вивчення спонтанного мовлення багатьох дикторів свідчать про те, 
що ніхто з них не дотримується орфоепічних правил вимови у повному обсязі. Насам- 
перед це стосується заборонених літературною нормою регресивної асиміляції за глухіс- 
тю в парі фонем «дзвінка-глуха» й оглушення приголосних перед паузою (тобто --» 
топто; підтримати -- п'їіттр,Имати;робив-»ро- бИ ф). Диктори з такими 
особливостями вимови були виділені в окрему групу. Було виокремлено й багато інших 
характерних рис вимови різних дикторів: редукція закінчень деяких слів (прикметників, 
дієслів) у злитому мовленні (шановний -»шан Овни; доброго » дОбро), 
«акання» (робити - раб И ти), тверда вимова м'яких приголосних (синього -» 
сИного)таїн. 

Для деяких слів (службових частин мови, слів із різними наголосами, наприклад) 
задається декілька варіантів транскрипцій - із наголосом на різних складах (якщо 
в мові можливі різні варіанти прочитання таких слів) або взагалі без наголосу: коли -» 
колЛИи;кОли;коли. 

Такі тенденції моделюються шляхом зміни правил переходу від одних послідов- 
ностей символів до інших і розширенням чинних правил. 

Усі правила індивідуалізованої модифікації транскрипцій можна розділити на 
декілька груп (на основі опрацювання звукових записів). 

До позиційних (змін, що залежать від загальних фонетичних умов - позиції 
у складі/слові, наголошеності/ненаголошеності тощо (101) нелітературних змін звуків 
у потоці мовлення зараховуємо: 

1)ослаблену вимову о як а в ненаголошеній позиції, рідше трапляється 
редукція ненаголошених голосних до повного зникнення (тепер -» тип Кр, зозуля 
-ззузУ л'а,боротьба-» барад'б Аабобрад'б А); 

2) оглушення дзвінких приголосних перед паузою (брід -» б р' І т, зараз-»зАрас); 

3) редукцію у термінальних частинах слів у процесі мовлення - зникнення при- 
голосного звука в закінченнях -ого, чих, -ич, -ий, -іх, -ій, -1ї, -ої, -еї, -ою, -єю, -ити та 
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подібних (коротший -»корОчтшии, Іванович -» ів Ановий, синіх -» с И- 
н' і, безпекою - беспЕко у); зникнення кінцевого голосного звука в закінченнях 
-ою, -ею, -єю та подібних (доброю -»д Оброй, землею -» землЕй) таїн. 

До комбінаторних (якісні та кількісні зміни сусідніх звуків (101) нелітератур- 
них змін відносимо: 

1) повну регресивну асиміляцію за глухістю у сполуці «дзвінкий-глухий» на 
межі будь-яких морфем у слові та на межі слів (без причини -» беспричиИни, 
розсунути» россУнути,книжка-»кнИшка,сядьте-» с А т'те); 

2) асиміляцію за м'якістю свистячих та шиплячих приголосних, губних та зад- 
ньоязикових приголосних (злі -» з" л' І, шлях -» ш' л' А х, квітка -» к'в'І тка); 

3) вимову подовжених приголосних звуків як звичайного неподовженого звука, 
вимову двох голосних як одного звука (віддати -» в'ї д А ти, знання -» з на- н'А, 
зоопарк -"зопАрк,аеропорт--аропОрт); 

4)неповне спрощення в групах приголосних, його відсутність (чесний -» 
чЕстний)таїн. 

Для створення індивідуалізованих словників вимови всі досліджувані диктори 
були розподілені на групи, що відбувалося в кілька етапів: перший передбачав вио- 
кремлення групи дикторів із літературним мовленням та дикторів із відхиленнями 
від літературної норми; наступною ділянкою роботи було виділення найзагальніших 
спільних рис мовлення у другій групі та створення відповідних транскрипцій для кожної 
з підгруп. Таким чином було згенеровано 18 видів транскрипцій словника для тих чи 
інших дикторів. Адекватність індивідуалізованих транскрипцій перевірялася за допомо- 
гою розпізнавання мовлення (покращення/погіршення результатів розпізнавання для 
конкретного диктора у порівнянні з результатами розпізнавання для цього ж диктора 
з використанням літературної транскрипції). Кожна з транскрипцій була перевірена 
на всіх дикторах. Приклади словників - у табл. 2. 


Таблиця 2 - Приклади індивідуалізованих словників спонтанного мовлення 


Індивідуалізований 
словник деуосаї 
| деуосаї епі соп5 а б 
Літературна а 
транскрипція 
робИв робиф роби рабИв | рабиф 
вОрог вОрох вОро вОраг вОрах 


Для досліджень вимови (1 для навчальної вибірки під час розпізнавання) вико- 
ристовувалися записи засідань Верховної Ради України тривалістю 99 тис. с, у яких 
зустрілося понад 210 тис. слів. Усього було записано 208 дикторів. Дикторів із три- 
валістю запису понад 300 с виявилося 87 (запис тривалістю менше 300 с є занадто 
коротким для точних висновків у процесі розпізнавання) |31. 

Для перевірки правильності транекрипцій (і для контрольної вибірки під час роз- 
пізнавання) використовувалися записи тривалістю 30 тис. с, у яких зустрілося понад 
68 тис. слів. Ці записи були зроблені у відмінні від навчальної вибірки дні. Всього 
використовувалися записи 118 дикторів. Дикторів із тривалістю запису понад 300 с 
виявилося 37. 

Словник для генерування транскрипцій був створений із текстів стенограм засідань 
Верховної Ради України. Із офіційного сайту Верховної Ради були завантажені стено- 
грами засідань, починаючи з 1991 р. Усі тексти стенограм (понад 15 млн слів) були 
модифіковані для того, щоб усунути зайву інформацію (наприклад, повідомлення про 
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аплодисменти чи вигуки), записати числа словами, а також відокремити український 
текст від російського. У результаті було отримано словник із приблизно 150 тис. слів, 
для якого обчислено частоту вживаності кожного слова. Було укладено словник на 
15 тис. одиниць із найчастотніших слів (50 і більше слововживань), який і став основою 
для аналізу. 

Щоб з'ясувати, наскільки впливає індивідуалізація транскрипції на надійність 
розпізнавання, було проведено ряд експериментів. Для цього зроблено оцінку пара- 
метрів акустичної та лінгвістичної моделей |8| із використанням інструментарію |2). 
Результати експериментів розпізнавання для деяких транскрипцій (покращення/по- 
гіршення результатів розпізнавання для конкретного диктора у порівнянні з резуль- 
татами розпізнавання для цього ж диктора з використанням літературної транскрипції) 
наведені у табл. 3. 


Таблиця 3 - Зразки результатів розпізнавання мовлення дикторів із використанням 
індивідуалізованих транскрипцій 


Словник епа уОму епд сопзя | еп соп5 
- епі УС - - а диріе8 
Диктор ГЦ в 1 
ПІ 0,16 0,14 -0,01 -0,01 -2,6 0,26 
Кіг 1,37 1,82 0 -1,06 -3,3 0,91 
ап 0,71 1,16 -0,09 -0,44 -5,4 0,18 


Після опрацювання результатів експериментів кожному з дикторів приписуються 
ті правила транскрибування мовлення, які підвищують надійність розпізнавання. Таким 
чином формується набір правил для генерування індивідуалізованих транскрипцій 
того чи іншого мовця. 

Як виявилося, частина правил транскрибування може бути використана для біль- 
шості мовців, наприклад, редукція закінчень унаслідок швидкого темпу та емоційності 
мовлення. Дуже поширеним явищем є оглушення, спричинене впливом російської мови. 
Значна кількість дикторів уникає вимови подовжених та подвоєних звуків. Часто зустрі- 
чається слабка вимова наголошених голосних (наголос зникає не тільки в односкладових 
чи двоскладових словах, а й у трискладових). Інші правила можуть бути використані 
лише для мовлення одного-двох дикторів. 

Генерування індивідуалізованих транскрипцій для розпізнавання мовлення до- 
зволило покращити його надійність. Надалі планується збільшити кількість індивідуа- 
лізованих транскрипцій за рахунок детальнішого аналізу мовлення дикторів, а також 
автоматично заносити мовців до тієї чи іншої групи, урахувавши всі особливості їх 
ВИМОВИ. 

Загальний словник транскрипцій для спонтанного мовлення був створений для 
розпізнавання мовлення дикторів акустичного корпусу українського ефірного мовлення 
(АКУЕМ) ЦП 1. Він поєднує у собі як правила літературної вимови, так і індивідуальні 
риси вимови окремих дикторів (враховуючи можливість неоднозначної вимови диктором 
того самого слова), а також окреслює специфіку спонтанного українського мовлення (на- 
приклад, задає наголошену та ненаголошену форми для всіх односкладових слів тощо). 

Для досліджень вимови (і для навчальної вибірки під час розпізнавання) викори- 
стовувалися звукові записи спонтанного мовлення із АКУЕМ тривалістю біля 190 тис. с 
(понад 2 000 дикторів). Особлива увага зверталася на мовлення дикторів із тривалістю 
запису понад 600 с (близько 150 дикторів). 

Словник для генерування транскрипцій був створений із текстів стенограм 
АКУЕМ - близько 50 тис. слів. 
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Для перевірки правильності транскрипцій (і для контрольної вибірки під час 
розпізнавання) використовувалися записи тривалістю 13,5 тис. с, у яких зустрілося 
29 500 слів. Всього використовувалися записи 34 дикторів із середнім та швидким 
темпом мовлення. 

Можливість генерувати одразу декілька варіантів транскрипції одного й того 
самого слова дозволяє продемонструвати в словнику варіативність вимови найчасто- 
тніших українських слів, редукування та розтягування слів під час швидкого темпу 
мовлення, нечітку вимову та подібні явища поряд із літературним варіантом вимови. 
Також система транскрибування дає змогу генерувати транскрипції для таких специ- 
фічних підсловників, як словник суржику, соціальних та територіальних діалектів, 
абревіатур та ін. 

Використання варіативного словника для розпізнавання спонтанного мовлення 
покращує надійність його розпізнавання |З). 

Надалі планується збалансувати набір правил, які породжують варіанти вимови 
слів у потоці спонтанного мовлення, а також використати індивідуалізовані словники 
(для 18 груп дикторів) під час створення єдиного словника для розпізнавання спонтан- 
ного українського мовлення. 


Висновки 


Запропонована модель дає змогу досить компактно описати закономірності пере- 
творень між графемами та фонемами у зручному для експерта вигляді з урахуванням 
неоднозначності перетворень. Розроблена реалізація моделі придатна також для роз- 
шифрування чисел, символів і скорочень. 

Уведення у модель довільної кількості рівнів транскрибування допомагає роз- 
класти правила, які задає експерт, на простіші. Це відкриває шлях до застосування 
запропонованого методу для транскрибування мов, у яких традиції написання не від- 
повідають вимові слів. У спонтанному українському мовленні спостерігається еквіва- 
лентне явище, але у зворотному напрямку: відхід реальної живої вимови від написання 
(1, відповідно, від правил канонічної літературної вимови). У системі розпізнавання спон- 
танного мовлення потрібно знайти баланс між детальністю фонемної транскрипції, то- 
пологією акустичних моделей фонем та кількістю параметрів, які уточнюють ці моделі. 

Результатом багатозначного розв'язку є послідовності символів, але при цьому 
не вказується, які з них більш імовірні. Оцінка відповідних імовірностей можлива на 
основі результатів розпізнавання, що є предметом подальших досліджень у цій сфері. 
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В.В. Робейко, М.М. Сажок 

Многоуровневая многозначная модель превращения орфографического текста в фонемньти 

В статье рассматриваєтся актуальньй вопрос порождения последовательностей фонем по орфографическому 
тексту и обратное преобразованиє. Предлагаєтся модель, в которой заложеньт закономерности связи между 
фонетическими и орфографическими символами. Многозначньєе преобразования, осуществляємьте согласно 
модели, зквивалентнь построению направленного графа. Параметрьт модели задаются таблично в виде 
контекстно-зависимьтх правил, которьтге формирует зксперт. В модели предусмотрено введение дополнитель- 
ньїх уровней транскрибирования, что позволяет зксперту строить сложньве преобразования, работая с 
относительно простьми правилами. Разработана система, на вход которой подаєтся орфографический текст с 
обозначениями ударений, а на вьтходе получаєм последовательности фонем, соответствующих различньжм 
вариантам произношения исходного текста. Приводятся примерьі практического применения системь! для 
автоматического распознавания украинской спонтанной речи. 


У. У. КоБеїко, М.М. 5аспок 

Миїіцієеусі Мишуашеад Модсеі їог Старпете-іо0-Рропете Техі Сопуег5іоп 

Іп Фіз рарег ууе сопзідег ре асішаї ргобіеті ої єгаррете-іо-рбопете сопуегзіоп Їог Гогуагі апа Баскууатд 
Фтесйїоп5. М/е ргоро5е пе плодеї дезсгібіпо, гериіаттійея ої геіайопя Бебмеєп Фе рібопейс апа зрейпє зупабоїз. 
Миїій-десізіоп гап5богпабопя сагтісд опі ассогаїпе 0 їпе плоді, аге едшімаїспі іо рийдпє ої а дїтесіва єгарії. Тре 
тоаеї рагатеїег5 аге зресійей їп кабиіаг Гог а5 а 5еї ої сопіехі-5еп5ійує гиіе5 Гоптей Бу пе ехрегі. Пптодисед 
аддїйопа! плоде! Іемеї5 ої ап5сгірйоп айоуу Ме ехрегі ко бшій согаріех ітап5їогпайогя, 5Ц му/огкіпо мб 
теіайуєіу 5ітріє гиіез. ТБе деуеЇорей зузіет їаке5 пе огіпортарбіс іехі мб Ше роїпіеа ассепіцайоп апа ргодисе5 
ріпопете зедиепсез сопезропаїпе їо Ще дїНегепі ргопипсіабоп уагіапів об'пе іприй їехі. ТБе ехашрієз ої ргасіїса! 
арріїсапопя ої їре 5убіега Гог ашіотабіс гесорпійоп ої ОЖгаїтіап зропіапеоця 5реесі аге дезспібед. 


Стаття надійшла до редакції 22.06.2011. 
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